图片OCR识别

本文介绍了如何使用Go SDK图片OCR接口,识别图片中的文字或卡证信息。

功能描述

通用OCR除了能够识别普通图片中的文字,还能识别结构化的卡证上的文字。关于参数的详细说明,请参见图片OCR检测API文档

前提条件

已安装Go依赖。关于安装Go依赖的具体操作,请参见安装Go依赖

说明

请一定按照安装Go依赖页面中的版本安装,否则会导致调用失败。

提交图片同步检测任务

接口

描述

支持的Region

ImageSyncScanRequest

提交图片OCR同步识别任务,对图片中的文字进行识别(scene=ocr)。

  • cn-shanghai

  • cn-beijing

  • cn-shenzhen

  • ap-southeast-1

示例代码

package main

import (
   "encoding/json"
   "fmt"
   "github.com/aliyun/alibaba-cloud-sdk-go/services/green"
   "strconv"
)

func main() {
   /**
    * 注意:此处实例化的client尽可能重复使用,提升检测性能。避免重复建立连接。
    * 常见获取环境变量方式:
    *     获取RAM用户AccessKey ID:os.Getenv("ALIBABA_CLOUD_ACCESS_KEY_ID")
    *     获取RAM用户AccessKey Secret:os.Getenv("ALIBABA_CLOUD_ACCESS_KEY_SECRET")
    */
   client, _err := green.NewClientWithAccessKey(
        "cn-shanghai", 
        "建议从环境变量中获取RAM用户AccessKey ID", 
        "建议从环境变量中获取RAM用户AccessKey Secret")
   if err != nil {
      fmt.Println(err.Error())
      return
   }

   task1 := map[string]interface{}{"dataId": "检测数据ID", "url": "待检测图片链接地址"}
   // 示例:身份证正面识别。
   cardExtras := map[string]interface{}{"card": "id-card-front"}
   // 示例:身份证反面识别。
   // cardExtras := map[string]interface{}{"card": "id-card-back"}
   // scenes:检测场景。
   content, _ := json.Marshal(
      map[string]interface{}{
         "tasks": task1, "scenes": [...]string{"ocr"}, "bizType": "业务场景", "extras": cardExtras,
      },
   )

   request := green.CreateImageSyncScanRequest()
   request.SetContent(content)
   response, _err := client.ImageSyncScan(request)
   if _err != nil {
      fmt.Println(_err.Error())
      return
   }
   if response.GetHttpStatus() != 200 {
      fmt.Println("response not success. status:" + strconv.Itoa(response.GetHttpStatus()))
   }
   fmt.Println(response.GetHttpContentString())
}